期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 以LDA为例的大规模分布式机器学习系统分析
唐黎哲, 冯大为, 李东升, 李荣春, 刘锋
计算机应用    2017, 37 (3): 628-634.   DOI: 10.11772/j.issn.1001-9081.2017.03.628
摘要924)      PDF (1169KB)(568)    收藏
针对构建大规模机器学习系统在可扩展性、算法收敛性能、运行效率等方面面临的问题,分析了大规模样本、模型和网络通信给机器学习系统带来的挑战和现有系统的应对方案。以隐含狄利克雷分布(LDA)模型为例,通过对比三款开源分布式LDA系统——Spark LDA、PLDA+和LightLDA,在系统资源消耗、算法收敛性能和可扩展性等方面的表现,分析各系统在设计、实现和性能上的差异。实验结果表明:面对小规模的样本集和模型,LightLDA与PLDA+的内存使用量约为Spark LDA的一半,系统收敛速度为Spark LDA的4至5倍;面对较大规模的样本集和模型,LightLDA的网络通信总量与系统收敛时间远小于PLDA+与SparkLDA,展现出良好的可扩展性。“数据并行+模型并行”的体系结构能有效应对大规模样本和模型的挑战;参数弱同步策略(SSP)、模型本地缓存机制和参数稀疏存储能有效降低网络开销,提升系统运行效率。
参考文献 | 相关文章 | 多维度评价
2. 基于复用的工作流过程定义工具——PDTBR
龚晓庆 刘锋 葛玮 郝克刚
计算机应用   
摘要1693)      PDF (643KB)(684)    收藏
为了提高工作流过程定义的效率,提出了一种基于复用的工作流过程定义方法。文中讨论了构建和描述可复用资产——领域业务本体和工作流模板的方法,给出了基于领域业务本体检索工作流模板的方法。在此基础上,开发了基于复用的过程定义工具PDTBR,并在实际使用中验证了该方法的可行性与有效性。
相关文章 | 多维度评价
3. 基于免疫遗传算法的软件测试数据自动生成
夏芸 刘锋
计算机应用   
摘要1694)      PDF (584KB)(1003)    收藏
提出了一种应用于软件测试中的基于免疫遗传算法(IGA)的软件测试数据自动生成的算法。该算法在传统的遗传算法中引入免疫算子,免疫算子其中包括获取疫苗、注射疫苗和免疫选择。实验结果表明,该算法的效果比传统的遗传算法效果好。
相关文章 | 多维度评价
4. 一种基于DCT和SVD的数字图像水印技术
刘锋,孙林军
计算机应用    2005, 25 (08): 1944-1945.   DOI: 10.3724/SP.J.1087.2005.01944
摘要1303)      PDF (161KB)(1229)    收藏
以离散余弦变换(DCT)、矩阵奇异值分解(SVD)为基础,提出一种数字水印算法,主要特点就是所嵌入的水印图像是灰度图像,增加了嵌入的信息量,能够满足数字水印系统的透明性和鲁棒性要求。实验结果表明:该算法不仅具有较好的透明性,而且对如叠加噪声、JPEG压缩、中值滤波、低通滤波、对比度增强攻击均具有很好的鲁棒性。
相关文章 | 多维度评价